SPSS 快速概览:统计函数
本教程将引导你了解 SPSS 的主要统计函数。它们主要与 COMPUTE
和 IF
命令一起使用。请注意,这些都是被试内 (within-subjects) (或“水平”) 函数。
对于被试间 (between-subjects) (或“垂直”) 函数,请参阅 AGGREGATE 命令。
本教程中的所有示例都使用 hospital.sav 数据集,该数据集可免费下载。
被试内与被试间函数。
SPSS 统计函数 - 缺失值 (Missing Values)
SPSS 统计函数仅在其所有输入值均为缺失值 (missing values) 时,返回系统缺失值 (system missing values)。 如果单个输入值为有效值,则输出值也将为有效值。 这适用于本教程中我们将介绍的所有函数。
请记住,SPSS数值函数 (numeric functions) 的情况则相反:后者仅在其所有输入值都有效时才返回有效值。
SPSS 统计函数 - 点运算符 (Dot Operator)
可以为统计函数指定最少数量的有效输入值。 这可以通过在函数后附加一个句点,后跟所需的有效值数量来完成。 例如,compute mean_v = mean.3(v1 to v5).
表示 “仅为 v1 到 v5 上至少有 3 个有效值的个案计算 mean_v。 有效值少于 3 个的个案必须在 mean_v 上获得系统缺失值。”
点运算符可以与本教程中涵盖的所有函数一起使用。 不要忽视它。 尽管它在 SPSS 用户中鲜为人知,但它是一项出色的省时功能。
仅为在输入变量上具有至少 3 个有效值的个案计算均值。
数据准备 (Data Preparation)
我们将仅使用数据中的最后 5 个变量。 严格来说,不允许对此类定序变量进行计算。 但是,请参阅 等距假设 (Assumption of Equal Intervals)。 如果我们未能指定用户缺失值 (user missing values),我们在它们上演示的函数可能会返回不正确的值。 因此,我们将通过使用以下 语法 (syntax) 运行 FREQUENCIES 来进行快速检查。 请注意步骤 5 中的 TO
关键字。
***1. 指定数据所在的文件夹。
**
cd 'd:/temp'.
***2. 打开数据文件。
**
get file 'hospital.sav'.
***3. 在输出中显示值和值标签。
**
set tnumbers both.
***4. 检查频率。
**
frequencies doctor_rating to facilities_rating.
***5. 为所有涉及的变量指定 6 作为用户缺失值。
**
missing values doctor_rating to facilities_rating(6).
SPSS MEAN 函数
SPSS MEAN
函数返回变量的均值。 如果存在缺失值,则有效值的总和除以有效值的数量。 下面的语法显示了如何计算被试内均值。
***计算 mean_rating 作为所有 5 个评分的均值。
**
compute mean_rating = mean(doctor_rating to facilities_rating).
exe.
SPSS SUM 函数
SPSS SUM
函数返回多个变量的总和。 在存在缺失值的情况下,返回所有有效值的总和。 请记住,在这种情况下,结果可能有些误导。 另请参阅 SPSS Sum - 警示说明 (SPSS Sum - Cautionary Note)。 下面的语法计算我们的评分变量的被试内总和。
***计算 5 个评分的总和。
**
compute sum_rating = sum(doctor_rating to facilities_rating).
exe.
SPSS MIN 函数
SPSS MIN
函数返回多个值的最小值(最小的值)。 我们通常将 MIN
用于 数值变量 (numeric variables),但从技术上讲,它也可以用于 字符串变量 (string variables)。 下面的语法在我们的评分变量上演示了它。
***计算变量的最小值。
**
compute min_rating = min(doctor_rating to facilities_rating).
exe.
SPSS MAX 函数
SPSS MAX
函数返回多个值的最大值(最大的值)。 就像 MIN
一样,它也可以用于字符串变量。 下面的语法计算评分变量的最大值。
***计算最大评分。
**
compute max_rating = max(doctor_rating to facilities_rating).
exe.
SPSS SD 函数
SPSS SD
函数返回多个变量的标准差 (standard deviation)。 请记住,我们这里指的是被试内标准差。 SPSS 在计算标准差时除以 (n-1)。
计算被试内标准差在调查研究中非常有用,可用于检测答题一致者 (straightliners):对所有问题给出相同答案的受访者在这些问题上的标准差将为零。 这可能表明问题没有得到认真回答,在这种情况下,你可能希望将此类个案从分析中排除。 请参阅 SELECT IF 和 FILTER 以获取最可能的选项。
SPSS SD 函数语法示例
***1. 计算评分变量的被试内标准差。
**
compute sd_rating = sd(doctor_rating to facilities_rating).
exe.
***2. 将答题一致者移动到文件顶部。
**
sort cases by sd_rating.
***3. 从数据中删除答题一致者。
**
select if sd_rating > 0.
exe.
使用 SPSS SD 函数检测潜在的答题一致者。
SPSS VARIANCE 函数
SPSS VARIANCE
函数计算多个变量的被试内方差 (variance)。 它只是标准差的平方。
***计算评分变量的被试内方差。
**
compute variance_rating = variance(doctor_rating to facilities_rating).
exe.
SPSS MEDIAN 函数
最后,SPSS MEDIAN
函数返回多个值的中位数 (median)。 同样,请注意我们指的是被试内中位数。 下面的语法在我们的评分变量上演示了它。
***计算评分变量的被试内中位数。
**
compute median_rating = median(doctor_rating to facilities_rating).
exe.